خوشه بندی نتایج جستجوی کاربران در وب با استفاده از الگوریتم های هوشمند

پایان نامه
چکیده

افزوده شدن روزانه بیش از یک میلیون صفحه به اطلاعات موجود در اینترنت به تنهایی نشان دهنده این است که در عصر کنونی ما با کمبود اطلاعات مواجه نیستیم بلکه با فقر دانش روبرو هستیم زیرا کشف دانش و آگاهی سودمند که مستتر در انبوه داده هاست روز بروز مشکل تر و پرهزینه تر می شود. و به طبع آن جستجو برای کاربران نیز فقط با صرف هزینه بیشتر امکانپذیر است.در این پایان نامه ما قصد داریم با بررسی روشهای موجود در خوشه بندی داده هایی که در حقیقت همان نتایج حاصل از جستجوی کاربران در وب هستند ،نقاط ضعف آنها را بیابیم .با انجام آزمایشات با داده های متنوع و در محیط های مختلف به این درک رسیدیم که در خوشه بندی داده های کاربر، کیفیت نتایج بدست آمده از الگوریتم مرسوم خوشه بندی k-means بسیار متغیر بوده و این می تواند از جمله مهمترین دلایل پرهزینه شدن جستجو در اینترنت باشد .به منظور حل این مشکل از الگوریتم های فرا ابتکاری و هوشمند در این زمینه کمک گرفتیم که با توجه به معایب الگوریتم k-means مناسبترین الگوریتم برای جایگزین نمودن ،الگوریتم بهینه سازی ازدحام ذرات بود.اما از آنجا که اینکار در عمل در نرم افزارهای داده کاوی تا کنون صورت نگرفته بود جهت انجام آزمایش و بررسی نتیجه میبایست ابتدا پیاده سازی کد الگوریتم پیشنهادی را با استفاده از مفاهیم نرم افزارهای متن باز تهیه و آنرا به نرم افزار مورد آزمایش وارد کنیم. با انجام دادن این اقدامات و ارزیابی نتایج حاصل دریافتیم که الگوریتم پیشنهادی خوشه های مناسبتر و پایدارتری تولید میکند که در نتیجه می توان در زمان جستجو نتایج ارزنده تری را به کاربر ارائه دهیم و هزینه جستجو را کاهش دهیم. و دستاورد ما علاوه بر کیفیت نتایج جستجو تولید شده ، در قدم بعد با توجه به سابقه و علایق کاربر به زمینه های مختلف ، رسیدن به یک سیستم توصیه گر فیدبک دار جهت تعیین احتمال حرکت بعدی کاربر و ارائه پیشنهاد به آن خواهد بود.

منابع مشابه

جستجوی هوشمند وب با استفاده از خوشه بندی

یافتن اطلاعات، یکی از نیازهای روزمره کاربران اینترنت است. موتورهای جستجو، پراستفاده ترین ابزار برای یافتن اطلاعات در وب هستند. با گذشت مدت زیادی از حضور موتورهای جستجو، و با همه پیشرفت ها در این زمینه، کسانی که بدنبال نیاز اطلاعاتی خود به این موتورها مراجعه می کنند، با لیست طویلی از نتایج جستجو برخورد می کنند. آن چیزی که استفاده از آنها را مشکلتر می نماید، این است که معمولا ترتیب نتایج برگشتی م...

15 صفحه اول

خوشه بندی کاربران وب و واکشی اولیه صفحات وب با استفاده از آنالیز معنایی پنهان احتمالاتی

در سالهای اخیر با توجه به رشد سریع وب جهانی، تحقیقات وسیعی پیرامون مدل کردن رفتار پیمایشیِ کاربران در وب¬سایت¬ها انجام گرفته است. در این راستا کاربردکاوی وب با هدف به¬دست آوردن الگوهای رفتار پیمایشی کاربران وب، مورد استفاده بسیاری از محققان قرار گرفته است. به¬طورکلی کاربران وب رفتارهای متفاوتی متناسب با نیازهای اطلاعاتی و وظایف مورد علاقه خود در بازدید از وب¬سایت¬ها از خود نشان می¬دهند، تمامی ر...

15 صفحه اول

یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر

  The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...

متن کامل

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

متن کامل

انتخاب خوشه های اولیه به کمک الگوریتم های هوشمند برای مشارکت در خوشه بندی ترکیبی

به علت بدون ناظر بودن مسئله خوشه بندی انتخاب الگوریتمی خاص جهت خوشه بندی یک مجموعه ناشناس امری پر خطر و معمولا شکست خورده می باشد. به خاطر پیچیدگی مسئله و ضعف روش های خوشه بندی پایه، امروزه اکثر مطالعات به سمت روش های خوشه بندی ترکیبی هدایت شده است. پراکندگی در نتایج اولیه یکی از مهم ترین عواملی است که می تواند در کیفیت نتایج نهایی اثرگذار باشد. همچنین، کیفیت نتایج اولیه نیز عامل دیگری است که د...

متن کامل

شناسایی خودرو در تصاویر UAV با استفاده از الگوریتم SIFT با رویکرد خوشه بندی عوارض موضعی

در طول چند دهه‌‌ی اخیر محیط‌‌های شهری بسیار بیشتر از گذشته گسترش یافته‌‌اند. یکی از مهمترین مشکلاتی که  در اکثر کلان شهرها و حتی شهرهای کوچک وجود دارد مدیریت سیستم حمل و نقل است. یک سیستم نظارتی پیشرفته از وسایل نقلیه‌‌ی درون شهری امکان...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023